Чтобы получить картинку, больше не нужно уметь рисовать

ТехИнсайдерHi-Tech

В начале было слово

Текст: Сергей Цыпцын

Буквально за один месяц графические нейросети из развлечения для гиков превратились в рабочий инструмент для иллюстраторов. Изменился и главный принцип создания изображений: теперь не важно, умеете ли вы владеть кистью или стилусом, – гораздо важнее жонглирование словами. Революция произошла практически мгновенно, и на то есть несколько причин.

Первой нейронной сетью, способной генерировать высококачественные картинки на основе текстовых описаний на английском языке, была DALL-E от компании OpenAI (один из основателей – Илон Маск). Разработчики представили ее 5 января 2021 года, но тогда программа не была доступна практически никому. Вторая версия, появившаяся в апреле этого года, DALL-E 2, уже умела создавать фотореалистичные изображения, одно из которых было размещено на обложке Cosmopolitan. Однако на работу с нейросетью было наложено множество ограничений: полученные картинки нельзя было использовать в коммерческих целях, запрещалось генерировать лица людей и т.п. И так бы все и продолжалось, если бы не конкуренты.

Слева: «Девушка с жемчужной сережкой», Ян Вермеер. Справа: «Девушка с жемчужной сережкой», DALL-E 2. Нейросеть DALL-E 2 может как генерировать изображения по текстовому описанию, так и дорисовывать существующие классические картины. Здесь ИИ не только достроил одежду девушки, но и нарисовал целую комнату с обстановкой. И почти каждый день выявляются все новые и новые таланты графических нейросетей.

Легенда

Главным конкурентом оказался легендарный Дэвид Хольц, написавший докторскую диссертацию по гидромеханике в NASA и Max Planck Society. Сначала он основал Leap Motion – компанию, разрабатывающую революционные 3D-контроллеры для интерфейса при помощи жестов, а через 12 лет – Midjourney, в которой работает меньше 10 человек. Во время тестирования прототипа нейросети Midjourney в сентябре прошлого года Хольц обнаружил интересную особенность: большинство людей не знают, чего они хотят. ИИ спрашивает: «Что ты хочешь?» – и получает ответ: «Собаку». «Какую собаку?» – «Розовую». Потом пользователь видит на картинке розовую собаку – и ему достаточно.

Но если людей собрать в группу, то кто-то обязательно добавит что-нибудь вроде: «Хочу космическую собаку», а другой дополнит: «Космического пса ацтеков». Это уже игра воображения: людям действительно нравится создавать вместе. В итоге Хольц решил сделать приложение Midjourney социальным: для входа вы должны зарегистрироваться в Discord – системе мгновенного обмена сообщениями, изначально облюбованной киберспортсменами. Сейчас на Discord у Midjourney гигантское сообщество – миллион человек, которые совместно придумывают новые изображения. «Каждый раз, когда вы просите ИИ нарисовать иллюстрацию, Midjourney не помнит ничего из того, что он делал раньше, – говорит Дэвид Хольц. – У него нет воли, нет целей, нет намерения, нет способности рассказывать истории. Воля, намерения и истории – это мы. Нейросеть просто двигатель для воображения. Двигателю некуда идти, но людям есть. Это что-то вроде коллективного разума людей, оснащенного современными технологиями».

Сходящиеся картинки

Человеческий мозг устроен очень интересно: с одной стороны, он подсознательно ищет на любой картинке что-то знакомое как символ безопасности, а с другой – его бодрит новизна. Мозг всегда ориентируется на два этих принципа. Когда показываешь человеку так называемые расходящиеся модели – изображения, на которых мозг не может найти привычных смыслов, – ему становится некомфортно. Художники используют этот метод интуитивно, десятилетиями к нему подбираются. А в нейросетях «сходимость/ расходимость» можно менять вручную. Правильная балансировка нейросетей – целое искусство: перекрутишь – картинка станет неинтересной, недокрутишь – мозги закипят.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Новая Москва Новая Москва

Мы давно хотели поговорить с главным архитектором столицы Сергеем Кузнецовым

ТехИнсайдер
Без крыши дороже Без крыши дороже

Стоят ли кабриолеты своих денег

Деньги
Кодекс поведения робота Кодекс поведения робота

В чем заключаются ключевые проблемы взаимодействия человека и ИИ

Популярная механика
Пластик, металл, стекло: какая посуда подходит для микроволновки Пластик, металл, стекло: какая посуда подходит для микроволновки

Какая посуда безопасна для микроволновки, а от какой лучше отказаться?

CHIP
Человек, который придумывает будущее Человек, который придумывает будущее

Компания с российскими корнями разрабатывает уникальные технологии для авто

Популярная механика
Альберт Филозов: «Такого мужа, как я, своим девочкам не пожелал бы» Альберт Филозов: «Такого мужа, как я, своим девочкам не пожелал бы»

Альберт Филозов — о том, как любовь продлила ему жизнь

Коллекция. Караван историй
Испытание делом Испытание делом

Экзоскелеты появляются в новостях нечасто и кажутся вещью из будущего

ТехИнсайдер
Связь с народом: зачем медицинским чиновникам блоги в соцсетях Связь с народом: зачем медицинским чиновникам блоги в соцсетях

Насколько эффективно органы власти используют цифровую открытость?

Forbes
Тритий пошел Тритий пошел

Изотоп водорода может подарить нам батарейки, работающие годы без подзарядки

ТехИнсайдер
5 сверхспособностей, которые станут доступны людям уже через 5 лет по версии футурологов 5 сверхспособностей, которые станут доступны людям уже через 5 лет по версии футурологов

Какие «суперспособности» станут реальностью уже к 2030 году — и какой ценой?

Maxim
Полетим Полетим

Уже в 2030-х можно будет добраться за город на летающем такси

ТехИнсайдер
Печать дьявола Печать дьявола

В модной индустрии тоже есть свои инновации, и одна из них – 3D-печать

Правила жизни
3500 км по Индии: Без карты. Без путеводителя. На трех колесах 3500 км по Индии: Без карты. Без путеводителя. На трех колесах

О незабываемых приключениях в Индии от первого лица

Playboy
Домашние роботы 2.0 — почему андроидам придется пройти семь кругов бюрократического ада Домашние роботы 2.0 — почему андроидам придется пройти семь кругов бюрократического ада

Эволюция робототехники: готовы ли мы морально и юридически к роботам-помощникам?

Inc.
Сила света Сила света

Как устроена индустрия световых шоу и инсталляций

Популярная механика
Камерно и точечно Камерно и точечно

Софья Синицына и ее год положительной трансформации

OK!
Не рокот космодрома Не рокот космодрома

Как и зачем строят космодромы

Популярная механика
Добро пожаловать на борт! Добро пожаловать на борт!

О чем нужно помнить, собираясь в аэропорт

Лиза
Дорога к свету Дорога к свету

QLED: в этих плоских панелях «упакованы» сразу две Нобелевские премии

ТехИнсайдер
«Медицина стала точной наукой» «Медицина стала точной наукой»

Революция в изучении человека и новые методы терапии рака: мнение профессора РАН

Монокль
История в фасадах История в фасадах

Число объектов культурного наследия в столице растет

Ведомости
Российский шик с японским акцентом Российский шик с японским акцентом

Зачем текстильные компании выбирают коллаборации как главный способ продвижения

Монокль
Вяземские Вяземские

Происходивший от Рюрика княжеский род Вяземских известен ещё со Средневековья

Дилетант
Поверив Гомеру… Поверив Гомеру…

Действительно ли Троя — это тот город, о котором идёт речь в «Илиаде»?

Дилетант
Неандертальцы наследили на португальских пляжах Неандертальцы наследили на португальских пляжах

Археологи обнаружили на португальском побережье отпечатки ног неандертальцев

N+1
Карманные мозги, что управляют всем: микроконтроллеры от первых 4-бит до IoT-революции Карманные мозги, что управляют всем: микроконтроллеры от первых 4-бит до IoT-революции

История микроконтроллеров от их зарождения до современных тенденций

Наука и техника
Россия на Ближнем Востоке играет в Realpolitik Россия на Ближнем Востоке играет в Realpolitik

Есть ли у России своя стратегия на Ближнем Востоке?

Монокль
Превратить экранное время в деньги: как поколение альфа зарабатывает в смартфонах Превратить экранное время в деньги: как поколение альфа зарабатывает в смартфонах

Дети и подростки, которым исполняется около 15 лет, уже зарабатывают деньги

Forbes
Стимулы вместо принуждения Стимулы вместо принуждения

Чем биржевая торговля сельхозпродукцией может быть интересна бизнесу

Агроинвестор
«Броненосец «Потемкин» и «Страна глухих»: как женщины меняют сюжеты в кинематографе «Броненосец «Потемкин» и «Страна глухих»: как женщины меняют сюжеты в кинематографе

Сценаристки, без которых невозможно представить советское и российского кино

Forbes
Открыть в приложении