Новый способ оптимизации предварительного обучения Больших языковых моделей

ТехИнсайдерHi-Tech

Разработан более дешевый способ обучения Больших языковых моделей

Команда ученых из Стэнфорда разработала новый способ оптимизации предварительного обучения Больших языковых моделей, который в два раза быстрее, чем существующие подходы. Это позволит значительно удешевить разработку Больших языковых моделей и сделать их создание более доступным независимым разработчикам.

Владимир Губайловский

ce9cebf76db8bc7877647f1250420a14_ce_1974x1316x0x83.jpg
Unsplash.com. DeepMind

Цель таких работ — сделать Большие языковые модели (такие как GPT), требующие миллионы на обучение, работающие на мощнейших компьютерах с огромными дата-центрами, доступными на домашнем компьютере или смартфоне. И разработчики двигаются в этом направлении.

Команда ученых из Стэнфорда разработала новый способ оптимизации предварительного обучения Больших языковых моделей, который в два раза быстрее, чем существующие подходы.

ChatGPT и другие приложения, использующие Большие языковые модели (LLM), находят все более широкое применение и привлекают пристальное внимание СМИ. Однако в сфере LLM доминируют несколько крупных технологических компаний, поскольку предварительное обучение этих моделей является чрезвычайно дорогостоящим процессом: стоимость начинается с 10 миллионов долларов. Сколько стоило обучение GPT не сообщается, но оценить его в миллиард долларов не будет серьезным преувеличением.

«Большие языковые модели не очень-то доступны для небольших организаций или академических групп», — говорит Хонг Лю, аспирант факультета информатики Стэнфордского университета.

Чтобы изменить ситуацию, Лю и его коллеги решили усовершенствовать существующие методы оптимизации LLM. В результате был разработан подход под названием Sophia, который сокращает время предварительного обучения вдвое. 

Оптимизация оптимизации

507231df3ff536c824bc47835115b915.jpg
Unsplash.com. DeepMind

Чтобы оптимизировать предварительное обучение LLM ученые использовали два приема. Первый, известный как оценка кривизны, не нов, но команда Стэнфорда нашла способ сделать его более эффективным.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Как мозг формирует привычки и почему от них сложно избавиться Как мозг формирует привычки и почему от них сложно избавиться

Мозг и привычки: причем тут дофамин и ошибки в предсказаниях?

ТехИнсайдер
Математики показали, что аналог GPS может работать на Луне. Ученым помогли идеи, которым уже 800 лет Математики показали, что аналог GPS может работать на Луне. Ученым помогли идеи, которым уже 800 лет

Спутниковой навигации, используемые на Земле, можно перенести на Луну

ТехИнсайдер
Облачные хранилища бесплатно: где и сколько можно получить Облачные хранилища бесплатно: где и сколько можно получить

Самые популярные облачные хранилища: у каких условия самые лучшие?

CHIP
Что такое глютен: мифы и правда Что такое глютен: мифы и правда

Что такое глютен и может ли он причинить вред?

РБК
Исследование показало что удовлетворенность жизнью имеет генетические корни Исследование показало что удовлетворенность жизнью имеет генетические корни

Черты личности и удовлетворенность жизнью в большей степени наследуются

Inc.
История игрушек: три культовые куклы на любой вкус, помимо Барби История игрушек: три культовые куклы на любой вкус, помимо Барби

Пони, трансформеры и фёрби: культовые куклы XX века

Правила жизни
Немой заговорил: пять стадий принятия звука в кино Немой заговорил: пять стадий принятия звука в кино

Как звук захватил кино и как индустрия пережила революцию

Правила жизни
Шахматист Ян Непомнящий: Выигрывать мне нравится больше, чем играть Шахматист Ян Непомнящий: Выигрывать мне нравится больше, чем играть

Сильнейший гроссмейстер планеты — о своем профессиональном пути

СНОБ
Гражданин хороший Гражданин хороший

Как в Китае контролируют население?

ТехИнсайдер
Найдены древнейшие ледники на Земле: они покоятся под африканским золотом Найдены древнейшие ледники на Земле: они покоятся под африканским золотом

Ученые обнаружили следы древнейших ледников

ТехИнсайдер
Как жить легче: учимся у французских скульпторов и психоаналитиков Как жить легче: учимся у французских скульпторов и психоаналитиков

Отрывок из книги «Французское искусство жить не напрягаясь»

Psychologies
Это не лень: как обмануть свой мозг и победить прокрастинацию Это не лень: как обмануть свой мозг и победить прокрастинацию

Отрывок из книги Дэна Уиллингема «Учись как профи»

Forbes
Маньяк держал в плену и жестоко насиловал россиянку в течение 14 лет: жертва смогла сбежать Маньяк держал в плену и жестоко насиловал россиянку в течение 14 лет: жертва смогла сбежать

Женщина сумела сбежать из дома мужчины, который держал ее взаперти с 2009 года

VOICE
Итальянские ароматы Итальянские ароматы

Итальянские травы — что это за приправа?

Наука и жизнь
В жителях Мачу-Пикчу разглядели выходцев из разных уголков империи Инков и Амазонии В жителях Мачу-Пикчу разглядели выходцев из разных уголков империи Инков и Амазонии

Палеогенетики отсеквенировали ДНК 34 человек в знаменитом Мачу-Пикчу

N+1
Огонь желания: как сохранить либидо в отношениях — интервью психоаналитиков Огонь желания: как сохранить либидо в отношениях — интервью психоаналитиков

Влечение непредсказуемо, загадочно, и мы не можем напрямую им управлять

Psychologies
Прыщи, усы и седина: «неидеальные» знаменитости, которым плевать на стандарты красоты Прыщи, усы и седина: «неидеальные» знаменитости, которым плевать на стандарты красоты

Эти звезды борются против бьюти-стереотипов, которые нередко портят нам жизнь

VOICE
Настоящая женщина: как вредят стереотипы — интервью психолога Настоящая женщина: как вредят стереотипы — интервью психолога

Почему современные женщины слишком зависят от мужского мнения?

Psychologies
Небесный дворец Небесный дворец

Чем занимаются китайские космонавты на своей орбитальной станции?

ТехИнсайдер
Парадокс страсти: 15 признаков дисбаланса в отношениях — проверьте свою пару Парадокс страсти: 15 признаков дисбаланса в отношениях — проверьте свою пару

О признаках дисбаланса в отношениях, которые и приводят к парадоксу страсти

Psychologies
Русские кошки: породы, выведенные в России и СССР Русские кошки: породы, выведенные в России и СССР

Аборигенные породы, которые вывели российские фелинологи

Maxim
Исследование: 95% россиян сталкивались с корпоративным абьюзом Исследование: 95% россиян сталкивались с корпоративным абьюзом

Абьюз на рабочем месте может проявляться по-разному

Forbes
10 странных книг, написанных в необычной форме 10 странных книг, написанных в необычной форме

Иногда писатели сознательно ломают форму произведений, чтобы было интереснее

Maxim
От носа до кишечника: почему микробиом человека так важен для нашего здоровья От носа до кишечника: почему микробиом человека так важен для нашего здоровья

Почему сообщества микроогранизмов так важны для нашего здоровья

ТехИнсайдер
Панк, алкоголь, нечисть: из чего состоит группа «Король и Шут» Панк, алкоголь, нечисть: из чего состоит группа «Король и Шут»

Покопаемся во вселенной группы КиШ и рассказать, из чего она устроена

Правила жизни
Бальзам для сердца. 8 самых полезных продуктов Бальзам для сердца. 8 самых полезных продуктов

Здоровье сердца во многом зависит от того, что лежит на твоей тарелке

Лиза
Кому подходит стрижка каскад и как ее сделать: советы стилистов Кому подходит стрижка каскад и как ее сделать: советы стилистов

В тренде снова стрижка каскад!

РБК
«Главное — никого не разочаровать»: 5 ловушек мышления, которые мешают стать счастливыми «Главное — никого не разочаровать»: 5 ловушек мышления, которые мешают стать счастливыми

Почему мы саботируем свой путь к счастью?

Psychologies
Кто такой Генри Форд и как ему удалось построить автомобильную империю Кто такой Генри Форд и как ему удалось построить автомобильную империю

Человек, который стал не только символом автомобилизации, но и изменил мир

РБК
Как ухаживать за ногтями, если тебе больше 50 лет: советы экспертов Как ухаживать за ногтями, если тебе больше 50 лет: советы экспертов

Какие изменения в свою бьюти-рутину надо внести после 50 лет?

VOICE
Открыть в приложении