SSM-модель — что нового она привнесла для мира нейросетей?

ТехИнсайдерHi-Tech

Сможет ли ИИ написать «Войну и мир-2»

Архитектура, разработанная T-Bank AI Research, делает шаг к решению такой масштабной задачи, как эффективная обработка очень длинных контекстов. Добиться такого серьезного продвижения удалось с помощью построения гибридной модели ИИ.

Владимир Губайловский

93bdccc482553ce1d8211fdf9f59daad_ce_1280x854x0x258.jpg
Толстой-ИИ. Midjourney

Революции ИИ продолжается. Но, кажется, время восторгов и безудержного хайпа проходит. Стали видны проблемы. Одна из них — это энергоэффективность. На ИИ работают целые мощные электростанции, а потребности только растут. И не видно, чтобы они стали снижаться. Но есть и другой момент. Уже возникла необходимость ставить ИИ-модели максимально близко к пользователю — и на компьютеры, и на смартфоны. Мощности этих устройств никогда не приблизятся к дата-центрам. А значит надо наращивать эффективность работы самих моделей, и здесь нужны новые решения.

Пока публика рисует картинки и развлекается разговорами с чат-ботами происходит глубокая внутренняя перестройка ИИ-моделей. Революция ИИ во многом началась не в тот момент, когда Microsoft в 2019 году выделила миллиард на развитие OpenAI и ее линейку GPT и дала компании доступ к своим дата-центрам.

Революция началась раньше: когда в 2017 году группа ученых опубликовала статью «Внимание — это все что нужно» («Attention Is All You Need»). После этого и появилась возможность развития с позиции силы: ученые открыли дорогу, по которой можно двигаться, бизнес оценил перспективу и включился по полной. Но не все решается «грубой силой» — простым наращиванием вычислительной мощности. Идеи, которые придумывают люди, все-таки важнее.

В этой статье 2017 года исследователи описали архитектуру трансформера и заявили, что нужен только механизм «внимания», а другие подходы, — рекуррентные и сверточные сети — «не нужны». Трансформер победил. Но исследователи и создатели ИИ, конечно, не забыли ни о рекуррентных, ни о сверточных сетях. Эти архитектуры тоже развивались хотя не и так громко, как трансформер.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Почему некоторые люди чихают несколько раз подряд Почему некоторые люди чихают несколько раз подряд

С чем может быть связано непрерывное чихание у людей?

ТехИнсайдер
Незаменимая лимфа Незаменимая лимфа

Лимфатическая система – зачем она нужна нам и какова ее функция в организме?

Зеркало Мира
Вход в провал: какие гаджеты опередили свое время и потерпели неудачу Вход в провал: какие гаджеты опередили свое время и потерпели неудачу

Гаджеты, которые обещали перевернуть нашу жизнь, но в итоге потерпели крах

Forbes
9 фраз, которые лучше никогда не произносить вслух 9 фраз, которые лучше никогда не произносить вслух

Чего не стоит говорить людям, чтобы не сделать им хуже?

Psychologies
Слушаем и не осуждаем: чем полезны сплетни на работе и когда они вредят коллективу Слушаем и не осуждаем: чем полезны сплетни на работе и когда они вредят коллективу

Как сплетни и слухи могут влиять на рабочий процесс и настроения в офисе

Forbes
Скажем истерике «нет» Скажем истерике «нет»

Как реагировать на детскую истерику?

Лиза
Ученый Горелов рассказал, как найти утечки тепла в доме Ученый Горелов рассказал, как найти утечки тепла в доме

Есть ли польза от бесконтактного термометра, где искать «мостики холода»?

ТехИнсайдер
Сколько зарабатывает дальнобойщик и как им стать Сколько зарабатывает дальнобойщик и как им стать

Как стать дальнобойщиком и сколько он зарабатывает, выяснил Autonews.ru

РБК
«Всюду одно растление и разврат» «Всюду одно растление и разврат»

Андрей Платонов о том, как он не стал советским писателем

Weekend
Как не выгореть на работе: 3 полезных правила Как не выгореть на работе: 3 полезных правила

Как перестать работать на износ?

Psychologies
«Это база: Зачем нужна математика в повседневной жизни» «Это база: Зачем нужна математика в повседневной жизни»

Чем важна в повседневной жизни задача коммивояжера

N+1
Из кожуры арбуза сделали ион-селективные мембраны Из кожуры арбуза сделали ион-селективные мембраны

Китайские материаловеды изготовили ион-селективные мембраны из кожуры арбуза

N+1
Не только смартфон Не только смартфон

Полезные гаджеты и лучшие приложения для учебы

Лиза
Дождевые черви не смогут прокормить человечество в случае ядерной войны Дождевые черви не смогут прокормить человечество в случае ядерной войны

Сбор дождевых червей для пропитания оказался слишком трудоемким

N+1
Робот-гуманоид вышел на работу на завод BMW. Работодатель доволен Робот-гуманоид вышел на работу на завод BMW. Работодатель доволен

Компания BMW на своем заводе провела тестирование робота-гуманоида Figure 02

ТехИнсайдер
Три митрополита Три митрополита

Роль церкви в период правления Ивана Калиты

Дилетант
Кроссовер для правильного отпуска: тест-драйв Geely Atlas Кроссовер для правильного отпуска: тест-драйв Geely Atlas

Geely Atlas: кроссовер, в котором радует всё

ТехИнсайдер
Винодельня, одежда и веганский ресторан: как Новак Джокович заработал $340 млн Винодельня, одежда и веганский ресторан: как Новак Джокович заработал $340 млн

Бизнес-проекты великого теннисиста Новака Джоковича

Forbes
Почему мигранты хамят, насилуют и убивают: объяснили психологи Почему мигранты хамят, насилуют и убивают: объяснили психологи

В последние годы в России участились нарушения закона со стороны мигрантов

ФедералПресс
Второе дыхание: как преодолеть «плато» в похудении? Второе дыхание: как преодолеть «плато» в похудении?

О природе «плато» и о том, как все-таки сдвинуть вес с мертвой точки

Правила жизни
Любовь Константинова: «Меня сопровождает стойкое убеждение: все будет по судьбе» Любовь Константинова: «Меня сопровождает стойкое убеждение: все будет по судьбе»

Всегда впускаю историю каждой своей героини максимально глубоко, под кожу

Коллекция. Караван историй
Вавилонская башня: самые сложные и самые простые языки для изучения Вавилонская башня: самые сложные и самые простые языки для изучения

Почему одни языки легче выучить, чем другие?

ТехИнсайдер
Времена года повлияли на моральные ценности американцев Времена года повлияли на моральные ценности американцев

Одобрения сплачивающих моральных ценностей зависит от времени года

N+1
Куда уходят кадры: проблема «атомных городов» Куда уходят кадры: проблема «атомных городов»

Как обстоит ситуация с привлечением сотрудников в «атомных» ЗАТО

ФедералПресс
Логотип личности Логотип личности

Как дизайн трех знаменитых российских логотипов менялся вместе со страной

Правила жизни
Цепляет с первого дня Цепляет с первого дня

Кавказ: как окружить себя принципиально другой реальностью

2Xplore
«Еда – сердце ресторана, а музыка – его душа» «Еда – сердце ресторана, а музыка – его душа»

Звезда мировой гастрономической сферы Гагган Ананд – о дизайне впечатлений

Правила жизни
Приручить внутренних драконов: советы для любителей спорить и бездумно говорить «да» Приручить внутренних драконов: советы для любителей спорить и бездумно говорить «да»

Проверенные стратегии для укрощения «драконов» — вредных ментальных привычек

Forbes
Как появилась любовь с точки зрения эволюции: мнение биолога Ирины Якутенко Как появилась любовь с точки зрения эволюции: мнение биолога Ирины Якутенко

Как природа помогает парам укреплять связь?

Psychologies
Без перегрузок Без перегрузок

Как правильно выбрать кружок или секцию для ребенка

Лиза
Открыть в приложении